課程資訊
課程名稱
資料科學與社會研究
Data Science and Social Inquiry 
開課學期
108-1 
授課對象
社會科學院  經濟學系  
授課教師
林明仁 
課號
ECON5166 
課程識別碼
323 U1250 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期一2,3,4(9:10~12:10) 
上課地點
社科502 
備註
與謝吉隆合授
限學士班三年級以上 或 限碩士班以上 或 限博士班
總人數上限:60人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1081DSSI 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程旨在培養具備社會科學領域知識 、與資料及量化分析能力之跨域人才。基於社科院學生對當代經濟、政治、社會等議題的分析與洞察力,本課程擬建立學生對計算機與程式應用的專長。通過此課程的訓練,學生將同時具備觀察問題、蒐集資料、 分析資料、及解讀分析結果的能力,從而在數位資料日益豐富、演算工具日 新月異的趨勢下,得以掌握先機,回應新時代的社會需求,解決新時代的社 會問題。  

課程目標
待補 
課程要求
1. 本門課為經濟系跨域學程必選修科目,故選課將以經濟系及輔修、雙主修為優先,社科院次之,並希望選修者應修過經濟系或社科院的統計課程,操作過stata為佳。
2. 相較於過去的課程,本學期課程有兩大改變:1) 學分由二學分變為三學分,2) 採用翻轉教室教學。改變的原因其一在於讓學生可以利用時間自學並複習,自我掌控學習進度和學習強度。
3. 本課程包含39小時的課程錄影,學生必須在家閱讀完「前20小時」課程內容,並於第八週參加期中考,以累積足夠實力來設計並完成專題,另有一次小次課堂小考。
4. 期末專題需採用R語言,除機器學習部分外,經發現使用其他語言經喪失專題部分總成績5分。整個專題用Python寫,喪失專題總成績10分。
5. 如因個人因素無法到堂需依照台大線上請假程序請假
 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
DataCamp (https://www.datacamp.com). We would like to deliver out thanks to datacamp which provides free materials for education.  
參考書目
待補 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
Midterm 
15% 
 
2. 
Attendance 
10% 
5% for in-class part, 5% for at-home part. 
3. 
Assignment 
35% 
1. Crawler designs * 3 2. House renting price prediction 3. Predicting election and referendum 4. Clickbait detection 5. Customer complains classification  
4. 
Project 
40% 
5% Pitching, 10% Poster Presentation, 10% Skills, 10% Creativity, 5% with R (Only allowing python for Machine learning) 
 
課程進度
週次
日期
單元主題
第1週
9/09  [In-Class] Course overview; Introducing programming environment
[At-Home] R Basic: data types and programming logic. 
第2週
9/16  [In-Class] Talk: Economics and Data Science
[In-Class] R Basic (Hsieh)
[At-Home] Importing Data and Tidyverse 
第3週
9/23  [In-Class] Reading data XLSX and CSV
[At-Home] Working with Data in the Tidyverse; Joining Data with dplyr in R 
第4週
9/30  [In-Class] Data manipulation: 2018 Referendum
[At-Home] String Manipulation in R with stringr
[At-Home] Reading JSON 
第5週
10/07  [In-Class] Text analysis of Trump’s tweets
[At-Home] Crawler designs 
第6週
10/14  [In-Class] Crawler design in Practice
[At-Home] Text mining in Chinese
 
第7週
10/21  [In-Class] Machine Learning: Theory and Applications I
[In-Class] Clickbait Detection in Practice
[At-Home] Visualization and Regression 
第8週
10/28  [In-Class] Midterm 
第9週
11/04  [In-Class] Days off to prepare your midterm 
第10週
11/11  [In-Class] Machine Learning: Theory and Applications II
[In-Class] Invited Talk
[At-Home] Unsupervised learning: Clustering and PCA: Ideology polarization on social media (3hs) 
第11週
11/18  [In-Class] Machine Learning: Theory and Applications III
[In-Class] Invited Talk
[At-Home] Supervised learning: Naive Bayes', Decision tree, random forests, and SVM on classifying customer complaint (6hs) 
第12週
11/25  [In-Class] Machine Learning: Theory and Applications IV
[In-Class] Invited Talk
[At-Home] Advanced Text mining: topic modeling and term network for news discourse analysis (3hs) 
第13週
12/02  [In-Class] Pitching
[In-Class] R Presentation 
第14週
12/09  [Project consulting] 
第15週
12/16  [Project consulting] 
第17週
12/30  [In-Class] Poster 
第18週
01/06  [In-Class] Selected Presentation